iT邦幫忙

2024 iThome 鐵人賽

DAY 4
0
佛心分享-我的私藏工具箱

正則!好好表達系列 第 4

Java在漢字、全形字的偵測

  • 分享至 

  • xImage
  •  

這問題也是出自於弱掃,系統提供一個備註欄給user隨意填寫,SA規格也未限制,導致被視為弱點。正常user幾乎輸入中文、全形字為主,阿拉伯數字則為半形。
經ChatGPT開示,可以在Regex使用以下Pattern搜尋

[\p{IsHiragana}\p{IsKatakana}\p{IsHan}\p{IsFullwidth}]

p{IsFullwidth}在Java並不支援,而且就算用[\\uFF01-\\uFF5E][!-~]也涵蓋不了所有全形字。所以最後也只能列舉,如下例:

"[\\p{IsHiragana}\\p{IsKatakana}\\p{IsHan},。;:() ~0-9/]{5,80}"

中秋節快樂!


上一篇
用Regex取得XML的標籤值
下一篇
隱碼公用程式
系列文
正則!好好表達14
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言